Predstavitev podatkov

Dva manjša popravka sem naredil direktno v podatke. Šlo je za napake:

Najprej bom naredil manjšo predstavitev za urne podatke. Prva ideja je, da najprej napovem za vse dneve vneprej v mesecu, potem pa manjšo granulacijo (na 15 min) dobim naknadno iz teh napovedi.

Tukaj damo funkcije za import podatkov. Ker se način poročanja skozi čas precej spreminja, se funkcije razlikujejo.

Naložimo podatke in preverimo, da nimamo podvojenih vrednosti v datetime stolpcu (da vidimo, kako je poročanje s spremembo ure in da se nismo kaj zmotili)

Opazimo, da je poročanje urnih podatkov enostavno čudno. V marcu upoštevamo, da se ura prestavi, v oktobru pa tega povečini ne naredimo, razen za leto 2020.

Enako velja za 15-minutne podatke, z izjemo leta 2021, kjer so podatki pri marčevski spremembi opuščeni (kot se zdi najbolj naravno).

Za prvo delo se torej najprej znebimo teh ničel in te dvojne vrednosti. To bomo potem upoštevali, ko naredimo finejšo granulacijo napovedi (tako sem si zdaj zamislil - lahko še spremenim). Zdaj ko imam zbrane podatke, jih pretvorim v časovne vrste z datetime indexom

Urni podatki

Naredimo resample in preverimo, da vse deluje, kot mora. (+ znebimo se marčevske spremembe ure)

Zdaj pa zlepimo, da dobimo kompletne urne podatke

Avtokorelacija urnih odjemov na dnevni in tedenski ravni

Ko gledamo urne podatke lahko opazimo, da imamo precejšnjo avtokorelacijo med enakimi urami v dnevu (na zamiku 24), prav tako pa je povečana avtokoralacija med enaki dnevi v tednu (pri zamiku 168). Na obeh grafih je prv povezava najbolj izrazita, pri obeh pa je opazen tudi porast avtokorelacije na tedenski ravni. Na grafu PCAF, ki upošteva učinek predhodnih avtokorelacij, je porast na tedenski ravni nekoliko bolj viden. V splošnem pa se zdi ta povezava nekoliko šibkejša od dnevne povezave (kar se zdi smiselno -- poraba je verjetno bolj odvisna od ure v dnevu kot od dneva v tednu).

Autokorelacije dnevnih odjemov na tedenski in letni ravni

Najprej izrišemo dnevne podatke:

Zdaj pa izrišemo avtokorelacije:

Zelo je opazno torej, da imamo autokorelacijo na dnevni, tedenski in letni ravni.

Shranimo podatke

S tem smo zaključili prvo predstavitev podatkov, nadaljevali bomo tako, da napravimo nek osnovni model, ki bo služil za referenčno točko pri ocenjevanju drugih, morda zapletenejših modelov. Za nadalnje delo shranimo uvožene in popravljene podatke.